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摘要 :【[ 目的 /意义 ] 从 主题 视角 对 环境 科学 领域 的 零 被 引 论文 进行 分 析 , 对 比 零 被 引 论文 与 高 被 引 论文 在 
文章 内 容 、 外 在 指标 方面 的 不 同 ,揭示 零 被 引 论 文 存在 的 原因 。 [方法 “过程 ] 首 先 ,对 来 自 Web of Science 数据 
库 的 国内 环境 科学 领域 的 260 篇 高 被 引 论 文 .907 篇 零 被 引 论 文 的 摘要 进行 PLDA 主题 识别 ,然后 通过 主题 相 
似 度 计算 发 现 主 题 间 的 关联 ,以 主题 热度 作为 内 部 指标 ,发 文 时 间 、 发 文 期 刊 作 为 外 部 评价 指标 ,最 后 ,把 论文 
主题 内 容 与 外 部 指标 结合 进行 零 被 引 与 高 被 引 论文 之 间 的 相同 主题 .不同 主题 对 比分 析 。 [ 结果 /结论 ] 在 研究 
主题 相 同情 况 下 ,期 刊 的 影响 因子 大 小 是 影响 零 被 引 论文 的 主要 因素 ;在 主题 不 同 的 情况 下 ,论文 研究 的 主题 
府 容 是 导致 零 被 引 论 文 的 主要 原因 。 
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的 期 刊 上 而 无 被 引 ? 针对 这 些 问题 ,本 文选 择 环境 科 


| 学 领域 的 高 被 引 论文 和 零 被 引 论文 数据 ,利用 PLDA 
随 者 科学 技术 和 信息 技术 的 发 展 ,科技 文献 数量 (Parallel Linear Discriminant Analysis ) 模型 , 即 并 行 隐 
而 增加 ,文献 引用 频次 的 研究 受到 研究 人 员 的 高 度 。 含 狄 利克 寺 分 布 模型 进行 主题 识别 结合 论文 的 发 


关注。 在 文献 计量 学 中 ,衡量 论文 影响 力 或 质量 的 基 时间 发 表 期 刊 等 指标 进行 分 析 , 评 价 各 指标 对 零 被 引 


本 弟 标 是 论文 的 被 引 次 数 "“”。 相 对 于 高 被 引 论文 而 。 与 高 被 引 论 文 的 影响 ,以 发 现 影响 零 被 引 论文 的 因素 
言 6 容 被 引 论文 的 关注 度 低 ,研究 热度 远 远 不 及 高 被 引 ”及 其 规律 。 
论文 ,但 零 被 引 或 低 被 引文 献 的 潜在 价值 ,如 果 被 发 气 

出 困 , 也 许 远 远大 于 我 们 目前 的 想象 ”。 零 被 引 论文 
是 指 一 个 国家 、 机 构 学科、 期 刊 或 个 人 在 某 年 或 某 个 20 世纪 50 年 代 美 国 著名 情报 学 家 上 .Garfield 提 
时 间 周 期 内 出 版 的 论文 集合 ,在 出 版 后 的 某 一 个 或 几 ”出 了 引文 分 析 方法 ,也 是 情报 分 析 和 科学 评价 的 常用 
个 不 同 长 短 的 引用 时 间 窗 口中 未 受到 任何 引用 的 论 方法。 但 是 以 往 的 各 类 指标 都 主要 倾向 于 关注 引用 分 
文 后 。 关 于 为 何 存在 零 被 引 论文 以 及 如 何 更 好 地 发 现 ， 布 曲线 上 代表 “高 被 引 论文 和 受 关注 论文 "的 头 部 , 却 
零 被 引 论文 的 价值 ,是 学 者 们 关注 的 问题 。 本 文 针 对 ”没有 关注 “ 低 被 引 论文 和 暂时 无 人 关注 的 论文 "。 根 
高 被 引 与 零 被 引 论文 提出 以 下 几 个 问题 :高 被 引 论文 。” 据 长 尾 理论 , 零 被 引 论文 对 科学 界 的 贡献 与 高 被 引 论 
因 研究 高 热度 主题 而 引用 频次 高 ,还 是 因 发 表 在 影响 。 文 所 做 的 贡献 相 匹 配 。2004 年 英国 学 者 A. Weale 
因子 大 的 期 刊 上 而 被 引 频次 高 ? 零 被 引 论文 因 主题 研 。” 等 外 提出 可 将 零 被 引 率 (non-cited rate) 作 为 期 刊 质量 
究 热 度 低 而 被 引 次 数 为 零 ,还 是 因 发 表 在 影响 因子 小 反 向 评价 指标 , 随后 T，N.， Van Leeuwen 和 H. 下. 
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Moed 发 现 期 刊 影响 因子 与 期 刊 论文 零 被 引 率 之 间 存 
在 下 降 的 函数 关系 ,两 者 的 皮尔 逊 相关 系数 为 负 
0.63“ .国内 学 者 唐 晓 莉 以 经 济 学 科 为 例 验 证 了 零 被 
引 率 用 于 期 刊 反 向 评价 是 合理 的 ”。 李 美玉 等 认为 图 
书 情报 领域 验证 零 被 引 率 可 以 作为 期 刊 关 键 评 价 指标 
的 反 向 指标 ,但 要 考虑 学 科 差异 ”。 通 过 研究 零 被 引 
率 与 期 刊 评 价 指标 之 间 的 相互 关系 ,并 基于 此 构建 新 
的 .融合 零 被 引 率 的 科研 评价 指标 ,扩展 了 期 刊 评价 的 
标准 ,肯定 了 零 被 引 论文 的 价值 。 为 了 对 零 被 引 论文 
进行 全 面 研究 ,学 者 们 对 零 被 引 论文 产生 的 原因 和 特 
征 进行 了 分 析 。 

关于 学 术 论文 得 不 到 引用 ,除了 论文 本 身 学 术 水 
平 外 ,是 由 很 多 因素 造成 的 。 方 红 玲 以 我 国 5 种 眼科 
笔 申 文 核心 期 刊 2003 年 发 表 的 零 被 引 论文 为 研究 对 


5 办 析 发 现在 下 载 量 和 被 引 量 关系 中 ,部 分 低 被 引 其 
玩 基 被 引 论文 具有 较 高 的 下 载 量 ,在 主题 分 布 中 , 零 被 
引 纶 文 主题 分 布 广泛 ”。 魏 瑞 滤 等 认为 造成 零 被 引 的 
扮 允 原 因 是 论文 选 题 太 偏 ,不 属于 主流 研究 领域 "。 
高 织 平 等 以 JCR 光谱 学 期 刊 为 例 ,认为 数据 统计 来 源 、 
座 妇 发 表 时 间 、 研 究 主题 等 是 零 被 引 论文 的 重要 影响 
过 “, 杨 思 洛 以 图 书 情报 档案 学 科 15 种 核心 期 刊 为 
例 E 入 为 零 被 引 论文 率 均值 与 篇 均 被 引 率 \ 也 指数 负 相 
泡 汪 综合 排名 正 相关 ; 零 被 引 论文 率 在 不 同时 间 .其 
刊 < 学 科 间 差异 明显 ，"。 胡 泽 文采 用 问卷 调查 法 寻找 
专 狂 引 的 原因 ,结果 表明 论文 发 表 时 间 短 ,论文 质量 不 
太 祝 ,论文 主题 偏 冷门 或 不 够 新 颖 、 所 发 期 刊 的 影响 力 


(或 质量 ) 较 低 是 出 现 零 被 引 的 主要 原 "一 


大 程度 上 影响 零 被 引 的 出 现 几 率 "“。 李 贺 琼 等 对 10 
种 外 科学 综合 类 期 刊 2011 年 零 被 引 论文 进行 分 析 , 发 
现 零 被 引 率 与 影响 因子 关系 不 大 ,署名 2 -5 位 作者 占 
大 多 数 , 第 一 作者 所 属 机 构 以 省 市 级 医院 为 主 , 零 被 引 
论文 无 基金 资助 占 大 多 数 , 论 文 类 型 以 临床 研究 和 病 
例 报告 为 主 '"]。 

总 体 看 ,研究 学 者 从 数据 本 身 对 零 被 引 论文 出 现 
原因 进行 相关 研究 ,包括 论文 的 类 型 .国家 和 机 构 科 研 
实力 ,基金 分 布 .学 科 差 异 、 语 种 .科研 合作 程度 、 文 章 
选 题 等 因素 ,引文 计数 虽 是 研究 论文 的 重要 指标 ,但 仅 
是 简单 的 数据 统计 分 析 , 并 没有 深入 到 数据 背后 对 应 
的 论文 主题 信息 。 即 使 从 主题 因素 进行 研究 ,研究 学 
者 仅 停 留 在 关键 词 .高 频 词 等 文本 信息 的 研究 ,没有 深 
人 到 论文 内 容 中 ,缺乏 语义 之 间 的 联系 。 本 文选 择 环 
境 科学 领域 的 高 被 引 论文 和 零 被 引 论文 数据 ,利用 
PLDA 模型 进行 主题 识别 ,以 主题 热度 作为 内 部 指标 评 
价 ,结合 论文 的 发 文 时 间 ,发 表 期 刊 等 外 部 指标 进行 分 
析 ,研究 分 析 零 被 引 论文 存在 的 原因 和 规律 。 


3 研究 思路 


为 了 进一步 分 析 零 被 引 论文 与 高 被 引 论文 之 间 的 
区 别 与 联系 ,笔者 将 论文 的 研究 主题 作为 内 部 评价 指 
标 , 将 发 文 时 间 、 发 文 期 刊 等 作为 论文 的 外 在 评价 指 
标 , 只 有 对 数据 进行 由 内 而 外 的 分 析 ,才能 有 效 分 析 零 
被 引 论文 的 特征 ,而 主题 模型 是 分 析 论 文 内 部 信息 的 有 
效 手段 。 本 文 的 研究 思路 分 为 3 个 步骤 ,如 图 1 所 示 : 


天 加 , 温 芳 芳 以 情报 学 期 刊 的 论文 为 研究 对 


Web of Science 
数据 收集 


主题 之 间 相 似 
度 计算 


象 ,通过 零 被 引 与 高 被 引 论文 的 比较 ,认为 | 
论文 的 可 见 度 和 可 获得 性 ,作者 的 影响 力 、 | 


论文 合 著 者 数量 以 及 论文 选 题 是 否 新 亲生 ------- 


热门 等 因素 , 均 对 论文 被 引 频次 产生 不 同 程 
度 的 影响 中。 杜 新 征 等 中 从 论文 类 型 .内 1! 


容 结 构 ,基金 分 布 . 作 者 机 构 分 布 . 页 码 和 语 
种 6 个 方面 分 析 《 水 生生 物 学 报 》 零 被 引 论 
文 的 特征 ,发 现 页 码 和 语种 与 零 被 引 没有 相 
关 性 ,其 他 指标 都 可 以 反映 零 被 引 论文 特 
征 。 赵 越 从 主题 因素 分 析 ,发 现 零 被 引 论文 
的 研究 主题 分 散 \ 陈 旧 , 但 是 研究 主题 并 没有 显示 出 偏 
离 学 科研 究 领 域 或 者 高 度 前 瞻 性 的 特点 。 况 书 梅 
等 以 图 书 情报 领域 的 论文 关键 词 为 主 对 论文 零 被 引进 
行 分 析 ,在 被 引 论文 与 未 被 引 论文 方面 ,二 者 的 研究 相 
似 度 逐渐 下 降 , 且 研究 内 容 与 学 科 热 点 的 相关 程度 很 
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图 1 高 被 引 与 零 被 引 论文 对 比分 析 研 究 思 


(1) 数 据 收集 与 预 处 理 。 首 先 确定 数据 的 来 源 ， 
选择 Web of Science 数据 库 进行 数据 的 搜集 ,根据 构建 
的 检索 式 获取 该 学 科 领 域 的 文献 。 然 后 对 获取 的 文献 
进行 预 处 理 和 数据 的 清洗 ,包括 去 除 停 用 词 标点 符号 
及 数字 ,提取 词 干 等 步骤 ,同时 对 该 领域 的 高 频 词 和 文 
献 中 无 意义 的 词语 进行 处 理 , 留 下 有 研究 意义 的 词语 ， 


潘 菲 , 王 效 熏 ,和 白 如 江 ，, 等 . 研究 主题 视 域 下 零 被 引 与 高 被 引 论文 分 析 


62(20)177=87; 


Chinaxiv 合 作 期 乔 


hh 1 n AX i\ /人 { 生 有 月 了 
以 环境 科学 领域 为 合 盯 ] 图 圳 法 4 竹 3018， 


为 之 后 的 文本 主题 识别 提供 支持 。 
(2) 主题 识别 与 相似 度 计 算 。 利 用 PLDA 模型 识 
别 出 蕴 含 在 高 被 引 论文 摘要 和 零 被 引 论文 摘要 中 的 主 
题 ,并 构建 主题 -文档 和 主题 - 主题 词 矩 阵 ,根据 主题 
- 主题 词 矩 阵 , 利 用 主题 相似 度 计算 方法 对 零 被 引 论 
文 的 主题 与 高 被 引 论文 的 主题 进行 相似 度 计算 ,发现 
零 被 引 论文 主题 与 高 被 引 论文 主题 的 区 别 与 联系 。 
(3) 特 征 提取 与 分 析 。PLDA 主题 模型 的 识别 结 
果 提供 了 主题 下 的 论文 发 文 时 间 发文 期 刊 等 数据 , 根 
据 提 供 的 主题 及 主题 下 的 数据 ,运用 主题 热度 ,发文 时 
间 ,发文 期 刊 等 指标 得 出 影响 论文 零 被 引 的 主要 因素 ， 
为 下 一 步 分 析 零 被 引 论文 的 原因 提供 方法 与 思路 。 
3.1 PLDA 主题 模型 
TPLDA 模型 是 基于 Gibbs sampling 近似 分 布 并 行 框 
架 位 LDA 模型 ,为 保证 主题 数量 的 准确 性 ,选择 统计 


语词 模型 中 常用 的 评价 指标 即 困惑 度 ( perplexity ) 确定 
主题 的 最 佳 数量 ,困惑 度 越 小 , 主题 识别 越 好 。D.，M. 
ji 等 定义 了 一 个 有 M 篇 文档 的 文档 集 的 主题 模型 的 


困 : 度 为， 


Di log p(w,) 
站 从 式 (1 
Eas log N, | A ) 


人 其 中 ,M 是 文档 集中 的 文档 的 数目 ,P(W,) 是 LDA 
模 剂 生成 第 d 篇 文档 的 概率 ,N, 是 第 d 篇 文档 的 单词 


erplexity( D,.,) -em| 


其 中 ,分 子 表示 两 个 主题 向 量 的 点 乘积 ,分 母 表示 
两 个 主题 向 量 模 的 乘积 。 
3.3 零 被 引 与 高 被 引 论文 对 比分 析 指 标 

本 文 借鉴 目前 研究 中 提出 的 混合 式 判 断 指 
标 ”” ,通过 分 析 ,总 结论 文 的 文本 内 容 、. 外 在 属性 等 
特征 ,提出 主题 热度 .发文 时 间 ` 发 文 期 刊 的 论文 分 析 
指标 体系 ,通过 指标 体系 的 构建 分 析 零 被 引 论文 现象 。 
3.3.1 主题 热度 指标 ”论文 的 发 文 量 、 被 引 量 可 以 作 
为 研究 热度 的 评价 指标 ” ,根据 本 文 识别 出 的 每 个 
主题 下 论文 数量 ,将 主题 热度 定义 为 每 个 主题 内 部 论 
文 数量 , 即 通 过 统计 不 同 主题 内 部 论文 数量 占 总 论文 
数量 的 权重 ,以 表征 各 个 主题 的 热度 ,主题 热度 能 够 直 
观 地 分 析 研究 主题 的 关注 度 ,影响 力 变化 趋势 。 

计算 公式 为 : 


公 二 (9 
其 中 ,74 代表 主题 热度 (topie heat) ;X 代表 每 个 
主题 下 的 论文 数量 ; 3 代表 所 有 主题 下 论文 数量 之 
和 。 

3.3.2 发 文 时 间 指标 “发 文 时 间 指标 ,是 分 析 指标 中 
的 基础 因素 ,主要 分 析 主题 下 不 同年 份 论文 数量 变化 ， 
根据 论文 数量 下 的 年 份 反映 主题 发 展 趋势 ,是 新 生成 


长 还 是 消亡 ,从 而 看 出 研究 学 者 对 论文 的 关注 度 。 


的 不 数 , 当 perplexity(D, ) 最 小 时 ,K 个 主题 最 能 够 表 
过 模型 的 语义 关系 , 即 可 以 确定 No of topic 主题 数 。 
3. 色 主题 相似 度 

-三 通过 PLDA 主题 模型 识别 出 来 的 主题 ,主题 内 部 
之 同 的 联系 可 以 用 主题 相似 度 进行 分 析 。 本 文 用 余弦 
相似 度 计算 主题 之 间 的 相似 性 并 设置 阔 值 Y, 相 似 度 
大 于 Y 则 认为 两 个 主题 之 间 相同 ,否则 视 为 不 同 。 第 
一 步 构建 向 量 空间 模型 ( Vector Space Model, VSM) , 把 
高 被 引 主题 与 零 被 引 的 主题 用 向 量 的 方式 进行 描述 ， 
向 量 空间 模型 中 用 T( Topic) 表示 主题 T(Temm ) 表示 
主题 词 \W(weight) 表示 主题 词 权重 ,主题 向 量 可 用 主 


题词 表示 为 Topic = 41, 忆 ,3B …… tn | \ 主 题词 权重 
向 量 为 Topic Vector = | wl ,w2,w3 …… wn | ,每 个 主 


题词 都 有 一 个 权重 ;第 二 步 计算 两 两 主题 之 间 的 相似 
度 ,计算 结果 介 于 [0,1] 之 间 , 数 值 越 大 相似 度 越 高 。 
主题 相似 度 计算 公式 为 : 

Sim( Topic,, Topic,) = cos0 = 


wr Topic,) x w,( Topic,) 


公式 (2) 


MCS CTopie)) x (Se (Topic,)) 


3.3.3 ”发 文 期 刊 指 标 ”科技 期 刊 是 论文 的 主要 载体 ， 
期 刊 质量 的 高 低 也 影响 论文 的 被 引 次 数 ,本 文通 过 零 
被 引 论文 与 高 被 引 论文 的 期 刊 对 比 , 得 出 期 刊 对 论文 
的 影响 。 本 文 运用 SPSS 的 指数 回归 进行 分 析 。 指 数 
模型 的 计算 公式 为 : 
Y=Boes 公式 (4) 
公式 (4) 中 ,了 为 每 个 主题 下 每 个 期 刊 的 载 文 量 ,> 
为 按照 时 间 排 列 论文 顺序 ,BB, 为 常数 。 


4.1 数据 源 与 预 处 理 

4.1.1 数据 源 Web of Science 具有 权威 性 .完整 性 
等 多 种 优势 ,因而 本 文 从 Web of Science 数据 库 中 进行 
数据 采集 ,并 选择 环境 科学 领域 作为 研究 学 科 。 检 索 
数据 库 :SCI-EXPANDED ; 数据 检索 式 :TI =“environ 
*”; 时 间 跨 度 :2006 - 2015 年 ;文献 类 型 .article and 
review; 检 索 类 别 及 研究 方向 :environmental science & 
environmental sciences ecology ;检索 国家 :Peoples R Chi- 
na; 检 索 语 种 ;English ;检索 时 间 :2017 年 6 月 20 日 ; 检 
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索 结果 :15 002 篇 。 对 检索 结果 进行 初步 分 析 , 根 据 零 
被 引 论文 的 定义 ,本 文 将 2006 -2015 年 10 年 间 被 引 
频次 为 零 的 论文 作为 零 被 引 论文 ;高 被 引 论 文 则 以 汤 
森 路 透 集团 “文献 评价 分 析 工 具 ESI 为 主 ,将 高 被 引 
论文 (most cited papers ) 定义 为 过 去 10 年 被 引用 次 数 
排 在 各 学 科 前 1% 的 论文 。 最 后 得 到 零 被 引 的 论文 
907 人 全文 数 量 为 260 篇 。 
通过 图 2 发 现 环境 科学 领域 高 被 引 论 文 和 和 零 被 引 
论文 数量 都 表现 出 增长 趋势 ,高 被 引 论文 在 2006 年 为 
0,10 年 后 ,高 被 引 论文 数量 达到 58 篇 ,说 明 在 此 期 间 
环境 科学 专业 有 较 好 的 发 展 ; 零 被 引 论文 在 2006 年 数 
量 为 19 篇 ,到 2015 年 作文 数量 达到 464 篇 ,是 2006 年 
论文 数量 的 24 倍 ,增长 幅度 大 于 高 被 引 论文 的 增长 幅 
麻 且 分 析 其 原因 主要 有 :人 论文 通常 会 在 发 表 的 一 至 
后 达到 引用 高 峰 ,因此 零 被 引 的 数量 较 多 ;@ 随 着 
诊 X 数 量 的 增多 ,不 相关 的 学 者 生产 出 与 之 不 相关 的 
论 贸 ,很 难 碍 阅 到 所 有 相关 论文 ,导致 论文 不 被 引用 。 


2006 2007 2008 2009 2010 2011 


2012 2013 2014 2015 


DC 年 份 


[qe 一 委 被 引 数量 一 一 高 被 引 数量 
高 被 引 论文 与 零 被 引 论文 数量 变化 折线 


1 总 数据 预 处 理 ”利用 文献 题 录 信息 统计 分 析 工 
具 SATI3.2 对 高 被 引 和 零 被 引 论文 摘要 进行 提取 , 然 
后 利用 Python 对 论文 的 摘要 部 分 进行 文本 数据 的 预 处 
理 和 清洗 ,包括 标点 符号 和 数字 剔除 .大 小 写 转换 、 停 
用 词 处 理 \ 词 干 提取 等 ,之 后 再 次 对 文本 数据 进行 清 


洗 , 去 掉 与 主题 不 相关 和 该 领域 的 高 频 词 ,如 environ- 


.三 四 


ment .environmental .china ,Elsevier .right ,paper 等 ,提高 
主题 识别 的 准确 度 。 结 果 见 图 3。 

4.2 零 被 引 论文 主题 与 高 被 引 论文 主题 对 比分 析 
4.2.1 实验 参数 设置 与 结果 分 析 对 文本 数据 进行 
处 理 之 后 ,要 对 数据 进行 主题 识别 ,主题 识别 的 准确 性 
与 主题 数量 有 很 大 关系 ,重要 的 参数 设置 为 主题 数量 
( No. of topic ) 和 主题 下 的 主题 词 数 量 (No. of words 
本 文 对 主题 数量 No. of topic 和 困惑 度 per- 
plexity 对 应 关系 进行 实验 。 由 于 高 被 引 论文 摘要 文本 
量 较 少 , 预 估 主题 数量 在 15 个 以 内 ,主题 数量 No. of 


per topic ) 。 
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图 3 论文 摘要 文本 处 理 结果 


topic 设 为 2 -12 个 , 按 步 进 量 为 2 进行 处 理 , 得 到 主题 
数 和 困惑 度 对 应 关系 ,如 图 4 所 示 。 从 图 4 中 可 以 看 
出 ,当主 题 数量 No. of topic 为 10 时 折线 变化 趋势 逐渐 
稳定 ,虽然 主题 越 少 困惑 度 越 小 ,但 会 造成 过 度 拟 合 ， 
因此 最 终 确定 主题 数量 No. of topic 为 10 ,每 个 主题 选 
择 15 个 主题 词 。 其 他 相关 参数 设置 : Alpha0. 5; 
Beta0. 1 ;和 迭 代 次 数 2 000。 

同 理 , 对 零 被 引 论文 的 摘要 也 进行 了 相应 的 实验 ， 
主题 数量 为 12 时 ,主题 困惑 度 趋 于 稳定 。 


主题 个 数 


图 4 高 被 引 论文 主题 数 和 主题 困惑 度 关 系 


零 被 引 与 高 被 引 论文 主题 识别 结果 如 表 1、 表 2 所 
示 ,不同 的 主题 代表 不 同 的 研究 内 容 , 对 识别 的 主题 结 
果 进 行 总 结 。 过 侈 下 耸 文 研究 主题 分 3 个 类 型 :中环 
境 污染 物 的 研究 。 主 题 0 是 通过 在 水 中 暴露 的 浓度 ， 
研究 污染 物 对 水 生生 物 和 植物 的 毒性 研究 。@) 自 然 生 
态 系统 的 评价 研究 。 通 过 数学 建 模 物理 建 模 、 空 间 建 
模 ` 景 观 生 态 模 型 法 和 各 种 监测 机 制 ,从 整体 的 角度 去 
评估 生态 系统 的 现状 及 变化 ,分 析 生 态 系 统 发 生 的 变 
化 及 原因 以 及 环境 变化 对 环境 自身 和 人 类 的 影响 ,为 
制定 合理 的 区 域 生 态 环境 管理 政策 ,遏制 区 域 生 态 环 
境 恶 化 ,改善 区 域 生态 环 境 质量 提供 依据 。 主 题 1 \ 主 
题 2 主题 3 主题 4 主题 6 .主题 11 是 关于 生态 系统 评 
价 的 研究 ,涉及 气候 地质 水文 等 各 方面 的 评价 ,其 中 
主题 11 基于 景观 的 评价 体系 是 生态 系统 的 新 视角 。 
@@ 针 对 不 同 的 污染 物 采用 不 同 的 治理 方法 。 通 过 对 主 


潘 菲 , 王 效 振 ,， 白 如 江 , 等 . 研 
62(20) :77 - 87. 


究 主题 视 域 下 零 被 引 与 高 被 引 论文 分 析 


YY i/ 全 人 


Chir A 人 | \ | 
以 环境 科学 领域 为 例 [J 央 清 凶 壮 镍 


题 5 主题 7 主题 8 主题 9 主题 10 的 分 析 , 发 现 该 主 
是 对 环境 污染 的 原因 进行 分 析 并 采用 微生物 - 生物 


涪 


技术 治理 大 气 , 河 流 ,土壤 中 的 污染 物 。 


表 1 零 被 引 论文 主题 识别 结果 


主题 主题 词 
Topic0 Concentr, studi, level, effect, exposur, active, toxic, significantly, indic, decreas, methane, control, factor, speci, potenti 
Topicl chang, studi, ，region ,climat river, model ,watersh, surface, process, eros, factor,season ,sedim, distribut 
Topic2 chang, wetland, studi,product, factor, effect, region, ecosystem, valu, season ,forest, develop, indic, natur 
Topic3 river, pollut, qual,method, assess ,studi,model, indic, index, region, factor ,concentr, base, health, ecolog 
Topic4 develop ,system, model, studi, manag, sustain, region, evalu,urban,chang, polici, paper, effect 
Topic5 model ,studqi ,growth ，us ，concentr ，strain ，investig ,level ，method ，effect ，health ，radionuclide ，degrade ，wast 
Topic6 model predict, method, particl, reservoir, studi, surface, effect, urban, base,algorithm, concentr, simul, propos 
Topic7 emiss, product,carbon, treatment, pollut, effect, studi, industry, energy, reduc, plant, mushroom, method, potenti, concentr 
Topic8 bacteri ，express ,studi ，effect, concentr ，protein ，activ ,cell level,metabol, detect, indic, exposur,sequenc 
Topic9 sedim, metal, heavi,organ, concentr, soil, plant, microbe, studi, sampl, indic ,content ，carbon nitrogen 
TTopiel0 remov, adsorpt, concentr, process, solute, studi, oxid, effect, treatment ,efficien , wastewat ,method condit, investig 


A YTopicl l 


speci, spatial, studi,commun, ecology, plant, index, indic, region, divers, pattern, factor, protect 


表 2 高 被 引 论文 主题 识别 结果 


主题 词 


TopicO 


adsorpt, surface, biochar, sorption, adsorb, magnet, magnetization, carbon ,interact, graphen, complexes, investing, isotherm, effect, nanotub 


antibiotics, concentr, detect, resist, respect, treatment, tetracyclines, investig sulfonamide, wastewater, bacteria, street, effluent, Correlations 


material , effect, barrier, industrial, pollut, concentrations, contamin, strategi,increase, agricultural, soil, efficien, swidden, automot, option 


effect, assess, chemic, pollut, biochar, nanoparticles, monitor, develop, provid, mixtur, exposur, sorption, zebrafish, impact, contamin 


structur, effect, climat, degrade, signific, electron, measure, applications, impact, hierarchical, challenge, efficien, ecosystem, region 


carbon, develop, responsive, product, system, increase, community, reserve, capture, effect, micropollutants, global, photocatalyt, energy, mercury 


e-waste, pollut, recycl, forest, understand, review, develop, impact, ecosystem ,potentiall reserv, region, concentr, improve, chemic 


energy, efficiency, consumption, industry, performace, reserve, product,economic, technology, develop, growth, construct, measure, pollut, process 


degradation, pollutants, process, product, health, effect, concentr, increas, treatment, antibiotics, particles, contamin, identify, potenti 


photocatalyt, catalyst, graphen, applic, materal, energy, perform, electron ,composit, structur, reaction, g-c3n4, exhibit, degrad 


三 高 被 引 论 文 主题 主要 分 两 类 :中 环境 污染 物 本 身 
的 研究 。 如 主题 1 抗生素 污染 问题 .主题 3 各 种 纳米 
材料 对 环境 的 潜在 危险 研究 、 主 题 4 各 种 污染 材料 的 
有 效 利用 、 主 题 6 电子 垃圾 和 重金 属 污染 的 处 理 ,这 些 
主题 从 不 同 的 方面 对 环境 污染 物 进 行 了 研究 ;@ 对 环 
境 污染 物 治理 的 研究 ,主要 从 治理 环境 的 材料 和 技术 
两 个 方面 进行 分 析 。 环 境 材料 对 污染 物 的 治理 有 主题 
0 .主题 2 .主题 7 ,主题 0 .主题 2 两 个 主题 从 石墨 烯 、 碳 
纳米 管 等 新 型 材料 的 吸附 功能 进行 污染 物 治理 研究 ， 
主题 7 从 生态 能 源 .绿色 能 源 的 角度 以 减少 污染 物 的 
产生 ;对 治理 污染 物 进 行 技术 研究 的 主题 有 主题 5 、 主 
题 8 主题 9, 这 3 个 主题 从 生物 治理 方法 、 降 解 技术 、 
光 催 化 处 理 技术 对 各 类 污染 物 治理 进行 研究 。 

从 主题 识别 的 结果 来 看 , 零 被 引 论文 的 主题 除了 
在 生态 系统 评价 方面 的 研究 ,还 包含 高 被 引 论文 的 研 


究 主题 , 即 污染 物 研 究 和 污染 物 处 理 技术 的 研究 ,由 此 
看 来 零 被 引 论文 的 研究 主题 更 加 广泛 。 高 被 引 论文 的 
主题 集中 ,研究 采取 具体 的 技术 措施 ,强化 对 有 毒 有 害 
的 危险 污染 物 的 认识 和 治理 方案 。 
4.2.2 主题 热度 “主题 热度 是 对 该 领域 的 研究 方向 
的 反映 ,不 同 的 主题 会 有 不 同 的 主题 热度 ,主题 热度 的 
大 小 则 代表 了 对 主题 的 关注 度 ,研究 热度 越 高 则 关注 
度 高 ,热度 越 低 则 关注 度 也 低 。 设 置 主题 热度 的 冰 值 
为 0.1, 大 于 0.1 则 主题 热度 高 ,关注 度 高 。 在 小 于 0. 1 
的 主题 中 ,根据 主题 热度 的 大 小 ,排名 最 后 的 3 个 主题 
为 低热 度 主题 ,其 他 剩余 主题 为 一 般 研究 主题 。 

零 被 引 与 高 被 引 论文 的 主题 热度 如 表 3 所 示 : 零 
被 引 论文 中 主题 4、 主 题 9 主题 10 为 高 热度 主题 ,一 
般 主 题 是 主题 0 .主题 1 .主题 3 .主题 6 .主题 8 和 主题 
11 ,主题 2 主题 5 .主题 7 为 低热 度 主题 。 同 理 ,高 被 
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引 论文 中 主题 0 .主题 1 .主题 7 .主题 9 为 高 热度 主题 ， 
主题 3 .主题 6 .主题 8 为 一 般 主 题 ,主题 2 .主题 4 主题 
5 为 低热 度 主题 。 


表 3 零 被 引 与 高 被 引 论文 主题 主题 热度 计算 结果 
零 被 引 主题 ”论文 数量 《主题 热度 ”高 被 引 主题 论文 数量 ”主题 热度 

0 70 0.077 7 0 37 0.1418 
1 68 0.075 5 1 28 0.1073 
2 60 0.066 6 2 20 0.076 6 
3 67 0.074 4 3 21 0.080 5 
4 101 0.772 7 4 17 0.065 1 
5 47 0.052 2 5 17 0.065 1 
6 78 0.086 6 6 23 0.088 1 
7 60 0.066 6 7 45 0.172 4 
8 62 0.068 8 8 24 0.092 0 

94 0.1043 9 29 0.1111 

133 0.1476 

61 0.0677 


] 主题 相似 性 ”利用 Python 的 Gensim 工具 包 对 
雪 被 引 与 高 被 引 论文 识别 出 的 22 个 主题 进行 相似 度 
计 营 ,通过 设置 阔 值 ,判定 零 被 引 与 高 被 引 论文 主题 的 
棍 似 程度 ,主题 相似 度 的 计算 结果 见 表 4。 


通过 相似 度 计算 发 现在 高 被 引 论文 主题 中 , 主题 
9 跟 零 被 引 论文 主题 的 相似 度 最 少 ,HI9 是 对 各 种 材 
料 作为 光 催 化 剂 的 研究 ,重点 研究 纳米 材料 ,如 石墨 型 
碳 氮 化 合 物 (g-C3N4) , 零 被 引 论文 主题 中 主要 集中 在 
微生物 处 理 技术 和 生态 系统 评价 中 ; 而 零 被 引 论文 主 
题 中 ,主题 11 跟 高 被 引 论文 的 主题 相似 度 最 少 ,ZT11 
是 生态 系统 评价 的 研究 ,包括 城市 .农业 、 和 森林 ,海洋 、 
景观 生态 等 各 个 方面 ,该 方法 可 以 对 各 种 潜在 的 土地 
生态 影响 进行 评估 ,在 高 被 引 论文 主题 中 没有 涉及 生 
态 系统 评价 。 为 了 将 零 被 引 论文 与 高 被 引 论文 放 在 相 
对 平等 的 条 件 下 进行 对 比 , 具 有 研究 意义 ,将 它们 之 间 
相似 度 的 阔 值 设 为 0.2, 大 于 0.2 即 主题 之 间 相 同 ,小 
于 0.2 则 不 具有 关系 。 通 过 表 4 得 出 相似 的 主题 有 4 
组 ,分 别 是 ZT2 与 HT4 关于 各 种 污染 材料 的 有 效 利 用 
的 研究 ,ZT4 与 HT5 是 水 污染 控制 与 环境 微生物 技术 
研究 ,ZT7 与 HT8 两 个 主题 研究 内 容 为 污染 物 处 理 技 
术 , 最 后 ,ZT10 与 HIO 是 关于 环境 吸附 内 容 的 研究 , 主 
要 是 吸附 的 技术 和 材料 研究 。 剩 余 的 其 它 主题 则 为 不 
相似 主题 。 


表 4 高 被 引 论文 主题 与 零 被 引 论文 主题 相似 度 计 算 结 果 


。 HTO HT1 HT2 HT3 HT4 HTS HT6 HT7 HT8 HT9 
. yiro 0.0625 0.0645 0.0625 .1250 0.0645 0.0625 0.066 8 0.0000 0.1875 0.0000 
“ZT1 0.0000 0.0000 0.000 0 0.000 0 0.133 3 0.000 0 0.069 0 0.066 7 0.064 5 0.000 0 
0.129 1 0.000 0 0.064 5 0.129 1 0.276 0 0.193 6 0.200 0 0.133 3 0.129 1 0.000 0 
0.000 0 0.064 5 0.062 5 0.125 0 0.064 5 0.000 0 0. 193 6 0.064 5 0.125 0 0.000 0 
0.066 8 0.000 0 0.066 8 0.133 6 0.138 0 0.200 4 0.1429 0.069 0 0.066 8 0.0000 
0.129 1 .1333 0.0645 0.0645 0.0667 0.0645 0.069 0 0.066 7 0.193 6 0.064 5 
0.064 5 0.066 7 0.064 5 0.064 5 0.066 7 0.064 5 0.069 0 0.000 0 0.129 1 0.000 0 
0.1230 0.1291 0.1250 0.1250 0.0645 0.1875 0.1336 1291 0.3122.5 0.0625 
ZT8 0.0645 4.1333 0.064 5 0.129 1 0.066 7 0.064 5 0.069 0 0.000 0 0.129 1 0.000 0 
ZT9 0.0645 0.0667 0.0645 0.000 0 0.000 0 0.064 5 0.069 0 0.000 0 0.064 5 0.000 0 
ZT10 0.2382 0.2000 0.0645 0.0645 0.1333 0.0645 0.069 0 0.0667 0.200 0 0.000 0 
ZT11 0.000 0 0.000 0 0.000 0 0.000 0 0.069 0 0.000 0 0.071 4 0.000 0 0.000 0 0.000 0 

注 :ZT0 为 零 被 引 主题 0;HT1 为 高 被 引 主题 1 
4.3 零 被 引 与 高 被 引 论文 相同 主题 特征 对 比分 析 度 高 ,共同 关注 该 领域 的 研究 热点 。 


4.3.1 零 被 引 与 高 被 引 论文 研究 主题 发文 时 间 对 比 
分 析 “通过 相似 度 计算 ,高 被 引 与 零 被 引 论文 有 4 组 


主题 相同 ,对 相同 主题 的 零 被 引 与 高 被 引 论文 的 研究 
主题 ,发文 时 间 和 发 文 期 刊 进行 研 究 ,主题 的 发 文 时 间 
见 表 5。 
(1) HTO 与 ZT10 特征 分 析 。 
结论 一 :主题 热度 高 。 论 证 :从 主题 内 容 上 分 析 ， 
是 关于 对 污染 物 吸附 内 容 的 研究 ,两 个 主题 的 主题 热 
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结论 二 :发 文 时 间 不 同 。 论 证 :HTO 的 研究 主题 近 
10 年 都 有 引用 ,发 文 时 间 最 多 的 一 年 是 2014 年 ;ZT10 
在 2006 -2011 年 间 零 被 引 论文 数量 较 少 ,2011 年 之 后 
才 开始 增长 ,分 析 其 原因 为 :环境 吸附 问题 作为 高 被 引 
主题 中 关注 度 高 的 主题 ,引起 了 研究 学 者 关注 ,产生 了 
众多 研究 成 果 ,导致 一 些 论文 还 没有 被 引 次 数 。 

(2)HT5 与 ZT4 特征 分 析 。 

结论 一 :主题 热度 不 同 。 论 证 :两 个 主题 研究 水 污 
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表 5 高 被 引 与 零 被 引 论文 相同 主题 发 文 时 间 对 比 


主题 年 份 数量 主题 年 份 数量 主题 年 份 数量 主题 年 份 数量 
HTO 2014 9 HT5 2014 4 HT4 2015 3 HT8 2014 7 
2015 6 2009 3 2010 4 2015 5 
2009 5 2010 3 2011 2 2011 4 
2010 3 2012 3 2012 2 2013 4 
2012 4 2013 2 2013 2 2009 2 
2008 3 2015 2 2014 2 2010 于 
2011 3 2007 1 2012 1 
2007 1 2009 1 
2013 ! 
ZT10 2015 68 ZIT4 2015 42 ZT2 2015 27 ZT 2015 37 
2014 23 2014 21 2014 14 2014 8 
2013 14 2012 二 2013 时 2013 
2012 11 2013 9 2012 5 2012 5 
Em 2011 6 2011 6 2011 3 2009 2 
2009 5 2006 4 2010 ' 2010 1 
2006 3 2009 1 2008 
2008 1 2007 
2007 1 


e 控 制 与 环境 微生物 技术 ,HT5 虽然 出 现在 高 被 引 论 
,但 研究 热度 低 , 而 ZT4 为 热点 主题 ,关注 度 高 。 
和 J 结论 二 :论文 发 文 时 间 靠 前 。 论 证 :该 主题 的 发 广 
f 同 都 集中 在 近 5 年 ,说 明 该 主题 作为 短期 的 研究 前 
沿 , 汪 有 新 颖 性 和 先进 性 ,但 还 没有 形成 体系 ,从 而 产 
生 大 量 零 被 引 论 文 。 
><(3)HT4 与 ZT2 特征 分 析 。 
人 结论 一 :主题 热度 低 。 论证 :虽然 两 个 主题 共同 关 
注 著 种 污染 材料 的 有 效 利用 ,但 研究 热度 低 。 分 析 其 原 
因 的 :污染 物 的 处 理 技术 研究 难度 升 高 ,如 厌 氧 技术 、 碳 
纳米 技术 等 ,需要 相应 的 设备 和 条 件 才能 推进 发 展 。 
结论 二 :发 文 时 间 具 有 可 持续 性 。 论 证 :该 主题 的 
发 文 在 近 10 年 都 有 被 引用 论文 和 未 被 引用 的 论文 ,主题 
研究 难度 高 ,突破 性 技术 少 ,导致 论文 发 表 时 间 周 期 长 。 
(4) HIT8 与 ZT7 特征 分 析 。 
结论 一 :主题 热度 低 。 论 证 :两 个 主题 研究 内 容 为 
污染 物 处 理 技术 ,但 研究 热度 低 。 
结论 二 :论文 发 文 时 间 不 同 。 论 证 :ZT7 近 10 年 
都 有 论文 发 表 , 而 HT8 最 近 5 年 论文 被 引 数 量 才 明 显 
增长 ,是 具有 研究 潜力 的 主题 。 
基于 主题 具体 内 容 ,通过 对 论文 主题 热度 的 分 析 
可 以 进一步 研究 主题 的 价值 和 关注 度 , 零 被 引 论文 的 
研究 主题 选择 高 被 引 论文 中 短期 的 前 沿 研 究 或 是 最 近 
几 年 才 开始 关注 的 话题 ,由 此 发 现 零 被 引 论文 善于 跟 
随 热点 研究 。 


4.3.2 零 被 引 论文 与 高 被 引 论 文 发 文 期 刊 对 比分 析 

首先 ,将 同一 主题 下 论文 按时 间 进 行 排序 ,然后 对 所 
在 相同 期 刊 的 数量 进行 统计 ,再 使 用 统计 分 析 软 件 
IMB SPSS Statistics 24. 0 进行 分 析 。 在 SPSS 软件 中 ， 
以 每 篇 论文 为 自 变量 (X) , 即 横 坐 标 Paper, 以 相同 期 
刊 上 载 的 论文 数量 为 因 变 量 (Y) , 即 纵 坐标 Quantity， 
通过 散 点 图 初步 判断 图 像 走势 ,运用 指数 函数 对 相关 
数据 进行 分 析 。 计 算 结 果 见 图 5。 

对 相同 主题 下 零 被 引 与 高 被 引 论文 发 文 期 刊 的 研 
究 , 从 以 下 几 个 方面 进行 分 析 : 

从 图 5 中 的 曲线 变化 看 , 零 被 引 论文 的 曲线 变化 
明显 ,说明 零 被 引 论文 集中 在 发 文 时 间 较 早 的 期 刊 上 ， 
而 高 被 引 论文 在 相同 期 刊 的 数量 随 着 时 间 的 推移 变化 
幅度 小 ,都 集中 在 稳定 的 数值 ,其 中 ,HTS 的 曲线 成 正 向 
增长 ,说 明 该 主题 的 论文 集中 在 近 几 年 发 表 的 期 刊 上 。 

从 论文 的 分 布 来 看 , 零 被 引 论文 分 布 相对 分 散 , 分 
布 在 不 同 的 期 刊 上 ,期 刊 种 类 多 ;而 高 被 引 论文 的 分 布 
相对 集中 ,有 规律 ,期 刊 种 类 少 。 

从 期 刊 的 载 文 数量 分 析 , 零 被 引 的 4 个 主题 中 ,期 
刊载 文 数量 最 多 的 前 5 名 期 刊 是 Fresenius Environmen- 


tal Bulletin (41)、 Environmental Progress & Sustainable 


Energy( 17) Sustainability( 14) Journal of Environmental 
Sciences( 13) Frontiers of Environmental Science & Engi- 
neering(13 ) ,其 影响 因子 分 别 是 0. 425、1. 672 .0、 
2.937 .1.716。 这 些 期 刊 的 专业 排名 是 Q3 .Q4 ,属于 排 
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5 相同 主题 下 零 被 引 与 高 被 引 论文 主题 的 发 文 期 刊 变化 
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文 分 析 一 以 环境 科学 领域 为 例 亲 ] 图 囊 请 报答 3018 > 


名 较 低 .影响 力 小 的 期 刊 。 在 高 被 引 的 4 个 主题 中 , 载 
文 数量 最 多 的 期 刊 是 Journal of Hazardous Materials 
(33) .Environmental Science & Technology (20) Science 


of the Total Environment(7) .Water Research (6) Energy 
区 Lnvironmental Science(4) ,其 影响 因子 分 别 是 6. 065 、 
3.751 .4.900 .6.942 5.715 .29.518。 通 过 期 刊 排名 表 ， 
这 些 期 刊 排名 为 Q1, 属 于 高 质量 、 影 响 力 大 的 期 刊 。 
通过 4.3.1、4.3.2 的 特征 对 比分 析 , 发 现 零 被 引 
论文 的 研究 主题 并 非 是 过 时 的 无 用 的 研究 主题 , 零 被 
引 论文 的 主题 紧 跟 高 被 引 论文 的 研究 热点 或 者 最 新 出 
现 的 主题 ,以 “热门 主题 ”或 具有 发 展 潜 力 的 主题 为 
主 。 从 发 文 期 刊 分 析 , 零 被 引 论文 虽然 主题 热度 高 ,但 
发 文 时 间 早 ,发 表 期 刊 种 类 多 并 且 发 表 在 影响 因子 小 
的 期 刊 上 ;高 被 引 论 文昌 然 主题 热度 低 , 但 发 表 时 间 
近 < 发 表 期 刊 种 类 相对 集中 并 且 期 刊 的 影响 因子 高 ,得 
到 WW 较 高 的 引用 频次 。 所 以 在 相同 主题 下 ,期 刊 影响 
轩 合 大 小 是 影响 论文 不 被 引用 的 主要 原因 。 

) 零 被 引 与 高 被 引 论文 不 同 主题 特征 对 比 

在 零 被 引 与 高 被 引 论文 中 还 有 各 自 的 的 研究 主 
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从 图 6 中 的 曲线 变化 看 , 零 被 引 论文 的 曲线 变化 
速度 快 ,论文 主要 集中 在 尾部 的 期 刊 ,说 明 大 部 分 期 刊 
上 存在 零 被 引 论文 但 数量 少 ;而 高 被 引 论文 在 相同 期 
刊 的 数量 随 着 时 间 的 推移 变化 速度 慢 , 说 明 高 被 引 论 
文 所 在 期 刊 的 引用 数量 差距 小 。 

从 论文 的 分 布 来 看 , 零 被 引 论文 分 布 相对 集中 ， 
定 在 几 种 期 刊 上 ,期 刊 种 类 少 ;而 高 被 引 论文 的 分 布 均 
匀 ,分 布 在 不 同 的 期 刊 上 。 

从 期 刊 的 载 文 数量 分 析 , 零 被 引 论文 中 论文 数量 
最 多 的 期 刊 是 Fresenius Environmental Bulletin(66) En- 


vironmental Science and Pollution Research(27) Environ- 


题 , 零 被 引 论文 是 ZTO .ZT1 .ZT3 .ZT5 .ZT6 .ZT8 .ZT9、 
ZT11 ,高 被 引 论文 是 HT1 .HT2 .HT3 、HT6 .HI7 .HT9， 
将 从 主题 热度 发文 期 刊 对 零 被 引 论文 与 高 被 引 论文 
进行 对 比分 析 。 

零 被 引 论文 中 ZT9 是 高 热度 主题 ,ZTO .ZT1 、.ZT3 、 
ZT6 .ZT8 .ZT11 是 一 般 热度 研究 主题 ,ZT5 是 低热 度 研 
究 主 题 ;高 被 引 论文 中 HT1 HT7 .HT9 是 高 热度 主题 ， 
HT3 .HT6 为 一 般 热度 主题 ,HT2 为 低热 度 主题 。 从 主 
题 的 研究 热度 分 布 来 看 ,高 被 引 论文 主要 集中 在 高 热 
度 主 题 ,其 次 是 一 般 热 度 主 题 ,说 明 高 被 引 论文 的 研究 
主题 有 很 高 的 关注 度 , 代 表 了 研究 前 治 ; 而 零 被 引 论文 
的 主题 集中 在 一 般 热 度 的 研究 主题 ,论文 的 关注 度 不 
高 ,在 论文 选 题 上 没有 把 握 当 前 的 研究 方向 。 

不 同 主题 的 零 被 引 论文 与 高 被 引 论文 的 发 文 期 刊 
对 比 , 如 图 6 所 示 , 在 SPSS 软件 中 ,以 每 篇 论文 为 自 变 
量 (X) , 即 横 坐 标 Paper, 以 相同 期 刊 上 载 的 论文 数量 
为 因 变 量 (Y) , 即 纵 坐标 Quantity , 主要 从 以 下 几 个 方 
面 进行 分 析 : 


Quantity 


T T T T T 
0 25 50 禾 100 125 
Paper 


不 同 主题 下 零 被 引 与 高 被 引 论文 主题 的 发 文 期 刊 变化 


mental Earth Sciences(27) Polish Journal of Environmen- 
tal Siudies (18) Journal of Coastal Research( 14) ,这 些 期 
刊 的 影响 因子 分 别 是 0. 425 、2. 741、1. 569 、0. 793、 
0.915 ,而 高 被 引 论文 中 刊载 论文 数量 最 多 的 期 刊 是 
Environmental Science & Technology(23) Journal of Haz- 
ardous Materials(22) Energy Policy(14) Enerey & En- 


vironmental Science( 12) Science of the Total Environment 
(11) ,其 影响 因子 分 别 是 6. 198 .6. 065 4. 140 .29.518 、 
4.9。 从 期 刊 影响 因子 对 比分 析 , 高 被 引 论 文 的 期 刊 影 
响 因子 高 于 零 被 引 论文 的 期 刊 影响 因子 ,期刊 质量 高 
于 零 被 引 论文 的 发 文 期 刊 , 零 被 引 论文 多 发 表 在 影响 
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因子 小 的 期 刊 上 。 
通过 以 上 分 析 , 零 被 引 论文 发 文 期 刊 相对 集中 并 
且 发 表 在 影响 因子 小 知名度 低 的 期 刊 上 ,而 高 被 引 论 


文 则 正好 相反 ,期刊 分 布 均匀 并 发 表 在 影响 因子 大 、 知 
名 度 高 的 期 刊 上 。 高 被 引 论文 除了 发 表 在 影响 因子 高 
的 期 刊 外 ,在 研究 主题 的 选择 上 优 于 零 被 引 论文 ， 
HT1 .HT7 HT9 是 高 热点 主题 ,研究 主题 新 颖 ,在 内 容 
上 得 到 的 关注 度 高 ;而 ZI0、ZT1、ZT3 ,ZT5 .ZT6 ,ZT% 等 
是 一 般 热 度 主题 ,研究 主题 关注 度 低 。 因 此 ,在 不 同 主 


题 下 ,研究 主题 内 容 是 影响 零 被 引 论文 存在 的 主要 原 
因 。 
5 结语 


二 针对 目 前 研究 中 主要 利用 文献 计量 指标 进行 零 被 
引 软文 原因 分 析 , 没 有 深入 到 文本 内 容 中 这 一 问题 ,本 
e 利 用 PLDA 模型 识别 高 被 引 与 零 被 引 论文 摘要 中 的 
当量， 通过 主题 相似 度 计 算 高 被 引 与 零 被 引 论文 主题 
学 地 的 相似 度 ,对 比分 析 零 被 引 与 高 被 引 论文 在 相同 
未 晴 . 不 同 主题 下 的 主题 热度 发文 时 间 发 文 期 刊 的 
丧 耽 变化 ,过 进一步 揭示 零 被 引 论文 产生 的 原因 。 
OY 在 主题 题 相 同情 况 下 ,发 文 期 刊 是 影响 零 被 引 论文 
的 于 要 原因 。 高 被 引 论文 以 期 刊 影响 因子 天 排名 较 
靖 谭 期 刊 为 主 ,高 被 引 论 文 在 一 定 程度 上 代表 了 研究 
前 泻 ,一 些 研究 人 员 紧 跟 其 后 发 表 相关 主题 的 论文 ,并 
请 舌 表 在 影响 因子 不 高 的 期 刊 上 。 这 种 重复 已 发 表 在 
中 四 期刊 上 的 "可 重复 性 项 目 "使 得 夫 被 引 论文 数 


局 


在 主 是 题 不 同 的 情况 下 ,论文 主题 的 选择 是 导致 堆 
被 引 论文 存在 的 主要 原因 。 高 被 引 论文 不 仅 发 表 在 影 
响 因 子 高 的 期 刊 上 ,并 且 研 究 主题 热度 高 ,主题 新 疾 ， 


具有 研究 价值 和 指导 性 作用 ;而 零 被 引 论文 大 多 选择 
主题 热度 一 般 的 主题 ,这 些 主题 具有 较 好 的 研究 成 果 


和 相对 成 熟 的 研究 体系 ,缺乏 创新 性 ,并且 论 文集 中 在 
影响 因子 小 的 期 刊 上 ,影响 力 小 。 

总 之 , 零 被 引 论文 并 非 是 毫 无 价值 的 。 我 们 要 探 
究 和 挖掘 零 被 引 论文 的 价值 ,不 要 因为 引用 次 数 的 限 
制 而 忽略 了 论文 本 身 的 价值 。 由 于 Web of Science 数 
据 库 对 论文 收录 范围 与 数量 有 限 ,在 样本 数据 获取 多 
计 处 理 与 分 析 方 面 难免 存在 一 ， 页 中 前 网 结 
果 仅 作为 一 定 的 参考 ,部 分 结论 还 有 竺 于 领域 专家 验 
证 。 
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An Analysis of Zero -cited and Highly -cited Papers in the Perspective of Research Topics : 
A Case Study of Environmental Science 
Pan Fei Wang Xiaoyue Bai Rujiang Zhou Yanting 
Institute of Scientific & Technical Information ,Shandong University of Technology ,Zibo 255049 
Abstract: [Purpose/significance | This paper analyzes zero -cited papers in the field of environmental science from 
tperspective of the subject, to find the differences in the content of articles and external indicators between zero-quoted 
Pageys and high -cited papers and reveal the reason for the existence of zero -cited papers. [Method/process | Firstly, the 


PEDA model was used to identify topics that from 260 high -cited papers and 907 zero-cited papers in the domestic environ- 


nm ho sciences database from the Web of Science database. Then the relevance of the topics was found through topic simi- 


larity calculation. With the topic popularity used as an internal indicator, the time of publication and the journals used as 


extmal evaluation indicators, a comparison analysis of zero -cited papers and high -cited papers was made by combining 


td Ql of the papers with external indicators. [ Result/conclusion | The experimental results show that under the same re- 


se dh topic, the influence of the journal is the main reason that influences the citation of the paper; under different top- 


idS=ihe topic is the main reason leading to zero-cited papers. 
CN 
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